2013/04/29

智慧家庭服務的幾個面向

智慧家庭(Smart Home, Smart House, Digital Home...etc.)嚴格說來是個重炒了很多次的冷飯,每隔幾年就會被重新提出來討論,當然每個年代有不同的技術成熟程度,智慧家庭的焦點也有所不同。

最近「智慧家庭」乃至於「智慧都市」又被拿出來討論,是伴隨著「物聯網」(Internet of Things, IoT)與「巨量資料」(Big Data)的議題,這兩個新的技術議題,讓智慧型的居家生活看起來又更有希望實現了一些。

這篇文章不打算細數這個話題過去發展的歷史,只是想簡短的點出長久以來各家服務供應商對這個議題觀注的幾個面向:

  • 家庭娛樂(Home Entertainment)
  • 家庭自動化(Home Automation)
  • 家庭保全(Home Security)
  • 健康看護(Home Healthcare)
  • 居家能源管理(Home Energy Management)
過去台灣對這個議題的發展,比較聚焦在「家庭娛樂」(影音串流、播放)這方面,但是過往幾年綠色能源的發展與無線通訊技術的突破,也讓其他議題逐漸的受到重視:像是中興保全就由「保全」的角度切入,進而提供健康看護和部分自動化的服務;台電和中華電信共同推動智慧電錶的計畫,也已經有初步可行的建築能源管理的方案;而健康看護,更是幾個大型醫療集團與科技大廠攜手角逐的下一個戰場。

如果從商業模式創新的角度,也可以先考慮這五個面向,了解目前市場檯面上與檯面下的玩家動態,進而找出沒有被滿足的需求點,其實還有不少新的遊戲可以玩。

2013/04/15

[Data Analytics] 巨量資料的能與不能

微軟的主任研究員 Kate Crawford 日前寫了一篇「巨量資料裡潛藏的偏差」(The Hidden Biases in Big Data),算是對 Big Data 抱以過度期待的一種反思。

「大量資料」是個抽象的觀念,也在媒體的鼓吹之下背負了過多的期望,讓人誤以為「只要資料的量夠大,資料就能自己說話」。
很遺憾的,資料是不會說話的。資料甚至不是客觀的,而是人類設計之下的產物。我們為數字發聲,從中產生推論,為了我們的主觀詮釋而去定義資料的意義。無論是資料的收集或分析,我們都早已在當中預藏了偏頗,而這些偏頗帶來的風險,在「巨量資料」這個主題上,事實上跟「資料」本身一樣重要。
 Crawford 以 Hurricane Sandy 和 Google Flu Trends 為例,佐證前述的問題。事實上,資料並不總是反映了社會現實,甚至還常常有很大的差距。在前述的兩個例子當中,即便收集資料的方式不斷推陳出新,也還是無法解決一些「收集不到需要的資料」跟「錯誤詮釋」的問題。

理解當前的限制,也可能是新突破的開端。Crawford 建議資料科學可以借鏡社會科學的方法學,因為這個領域自古就面對了這些問題。事實上這個建議和 DJ Patil 的建議相當類似,他認為物理學或社會科學訓練出身的人比資訊背景的更適合擔任資料科學家的工作(參見「如何打造資料科學團隊」一文)。處理現實問題,需要對問題的情境有足夠的理解(awareness of context),而不只是對資料本身進行複雜的分析。

總之,巨量資料在資料處理及分析技術的進步上,讓我們有機會看到更深的結構以及做更精準的預測,但是要應用在任何現實問題上,依然需要對問題的背景情境有夠深入的理解,才能「問對問題」,然後做出有意義的解答。簡單的說,巨量資料不能讓資料自己說話,但是能讓人用它來說出更好的故事。

2013/04/11

[Data Analytics] 資料分析的哲學基礎

年輕的時候喜歡附庸風雅,讀了很多哲學書。高中時本來也打算將來讀文學或哲學的,一直到讀了史蒂芬.霍金的「時間簡史」,看來看去一直讀不懂,意識到「科學」,或者至少物理學這一門,我是需要人帶入門的,才決定轉念自然組,理想科系也由哲學換成心理學。

雖然換了組別,亂讀書的習慣還是留了下來,大學時也跟幾個「偽文青」朋友按圖索驥的照著哲學史慢慢的讀著,討論著。

讀了這些東西,和後來的專業其實沒什麼直接的關係,但是不能否認的是,往後在討論比較抽象層次的議題時,這些知識在我腦海裡形成的地圖,可以讓我比較快定出自己所在的位置,跟應該前進的方向。

但這倒也不是全無壞處的。人如果真的思路一路跟著當代哲學走,從結構主義的各家觀點,走到解構主義或是後現代,那基本上就很難再回頭了,至少對我自己來說是這樣的:太習慣去解構人家提出的每個觀點,一方面會人緣不好,另外一方面也就不容易再去堅決的相信些什麼。

這也是後來選擇工程研發作為職業, "it is not what I claimed, but what I did, that defines me" 成為自我介紹,部落格標題還用了 esse ("存在"的拉丁文,不是德文的"吃")的主要原因。套用現在流行的用語,這也就是 "be data-driven"了。

這個冗長的開場白,到目前為止好像也只稍稍擦到題目的邊,無非是為了增加一點寫這篇文章的正當性。這裡不打算細說各家哲學理論,哲學史上重要的著作很多,即使只算我讀過的,也是很難一語道盡,更不用說相關的名家論述汗牛充棟,也輪不到我多嘴。

跟資料分析比較有關係的,應該是當代哲學跟科學哲學的部分,芬蘭一位教授 Jyväskylän yliopiston Koppa 的 Philosophy of Science  網站上倒是有不錯的摘要,去圖上點一點,可以快速的看到各派論點的摘要。

各家哲學的觀點,主要在詮釋「事實」(facts,實際發生的,可以被觀察到的事件)與「真實」(reality,真相,表象背後的深層真理)之間的關係。科學的各學門絕大部分都是以「事實」作為基礎的,所以除了走純理論的科學家之外,data-driven 算是共同的基礎,但是「資料驅動」可以驅動到什麼程度,就可以看出各個學派的差異了。

圖中靠外邊的那些理論,大多是認為「真實並不存在」、「不想討論真實的存在」或「真實即使存在,也難以用任何客觀的方式達到」的,所以 data-driven 可以比較不受限制;比較核心那些的觀點,就比較依賴人主觀形成理論來指引資料的詮釋。

在實務上,資料驅動的方法真的可以形成「知識」嗎?就筆者本身知道的,目前大概只有 Google 訓練電腦自己形成「貓」的概念,算是接近成功的例子,不過動用 16,000 個處理器去分析一千萬幅影像,不見得是一般人可以負擔的資源。其他大部分的資料分析應用,還是先由理論架構作為導引,比較能產生應用的價值。

目前只談到「資料分析」的整體,其實不同的分析方法背後也有其哲學意涵,那就以後再說吧。